AI032
Pemrograman Prosesor Paralel Besar: Pendekatan Praktis
Thread dan Penjadwalan CUDA Tingkat Lanjut
Tujuan Pembelajaran
- Analisis peran mesin GigaThread dalam distribusi blok global di antara Multiprosesor Streaming.
- Evaluasi dampak penjadwalan warp dan pengiriman instruksi terhadap pemanfaatan pipa.
- Optimalkan kinerja kernel dengan menyeimbangkan tekanan register dan memori bersama terhadap tingkat pemanfaatan.
- Mahir dalam primitif sinkronisasi tingkat lanjut serta pola eksekusi kelompok kooperatif.